iT邦幫忙

2022 iThome 鐵人賽

DAY 22
0
AI & Data

Machine Learning A-Z 學習筆記系列 第 22

[Day 22] Logistic Regression (1) - 原理

  • 分享至 

  • xImage
  •  

今天要學習的是邏輯回歸
https://ithelp.ithome.com.tw/upload/images/20221007/20152557h3oO1jPrto.png
左圖是今天的範例
我們想要預測不同年紀的顧客購買產品的機率
機率高 => 會買
機率低 => 不會買

我們一樣可以用線性回歸畫出一條線
線段在0,1 中間這段是有意義的 -> 代表一個顧客有多少機率會購買產品
但是左邊和右邊並不適用(最年輕和最年長的客戶)
因此這兩段線需要用別的方法來畫

Sigmoid Function

https://ithelp.ithome.com.tw/upload/images/20221007/20152557tA3PNMeI1S.png
上圖擷取自課程投影片
黑色的線可以用 y = b0 + b1 * x 來表示
然後從Sigmoid Function(S函數) 可以推出 y 是多少
結合量變數就會變成綠色公式
綠色公式可以畫出第二張圖所看到的綠線
綠線上所有的點都介於0~1之間
所以我們就完成了一條可以預測機率的線了

https://ithelp.ithome.com.tw/upload/images/20221007/201525575UoAPcaYPK.png
訓練集本身就是由一堆離散的點組成 (不是0就是1)
而模型上面的點都會加上一頂帽子來表示預測結果

假設現在有客戶年齡分別是20-50歲
對應到的y軸值就是購買產品的機率

至於客戶會不會購買產品要怎麼決定呢?
我們可以畫一條線在y=0.5 的地方
所有在0.5 以下的點, 我們都預測客戶不會購買產品, 因為機率小
所有在0.5 以上的點, 我們都預測客戶會購買產品, 因為機率大

假設我們有四組客戶資料
套用模型後的結果:
https://ithelp.ithome.com.tw/upload/images/20221007/20152557qRNyN4BtLL.png
左下兩個點會被投射到y_hat=0
右上兩個點會被投射到y_hat=1


上一篇
[Day21] 評估回歸模型的表現(4) - 回歸模型函數的意義
下一篇
[Day23] Logistic Regression-Example(01)
系列文
Machine Learning A-Z 學習筆記30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言